扬声器验证(SV)为访问控制提供数十亿个支持语音的设备,并确保语音驱动技术的安全性。作为一种生物识别技术,SV有必要公正,无论其人口,社会和经济属性如何,在演讲者之间保持一致和可靠的表现。当前的SV评估实践不足以评估偏见:它们过度简化和汇总用户,不代表现实生活中的情况,并且不考虑错误的后果。本文提出了用于构建解决这些短暂事件的SV评估数据集的设计指南。我们提出了一个用于分级话语对的难度的模式,并提出了一种用于生成包容性SV数据集的算法。我们在Voxceleb1数据集上的一组实验中验证了我们提出的方法。我们的结果证实了话语对/扬声器的计数,以及语音对的难度对评估性能和可变性具有重大影响。我们的工作有助于发展包容性和公平的SV评估实践。
translated by 谷歌翻译
自动说话者识别使用数据处理来通过声音来识别说话者。如今,自动化发言人的认可已在数十亿个智能设备和呼叫中心等服务中部署。尽管在面部识别和自然语言处理等相关领域中它们的范围广泛的部署和已知偏见来源,但自动说话者识别的偏见尚未被系统地研究。我们介绍了机器学习开发工作流程中的偏见的深入经验和分析研究,这是自动说话者识别的语音生物特征和核心任务。利用一个既定的框架来理解机器学习中的伤害来源,我们表明在著名的Voxceleb说话者识别挑战中的每个开发阶段都存在偏见,包括数据生成,模型构建和实施。受影响的大多数是女性演讲者和非美国国籍,他们经历了重大的绩效退化。利用我们的发现中的见解,我们提出了减轻自动说话者识别偏见的实用建议,并概述了未来的研究指示。
translated by 谷歌翻译
Rearrangement puzzles are variations of rearrangement problems in which the elements of a problem are potentially logically linked together. To efficiently solve such puzzles, we develop a motion planning approach based on a new state space that is logically factored, integrating the capabilities of the robot through factors of simultaneously manipulatable joints of an object. Based on this factored state space, we propose less-actions RRT (LA-RRT), a planner which optimizes for a low number of actions to solve a puzzle. At the core of our approach lies a new path defragmentation method, which rearranges and optimizes consecutive edges to minimize action cost. We solve six rearrangement scenarios with a Fetch robot, involving planar table puzzles and an escape room scenario. LA-RRT significantly outperforms the next best asymptotically-optimal planner by 4.01 to 6.58 times improvement in final action cost.
translated by 谷歌翻译
Robotic planning in real-world scenarios typically requires joint optimization of logic and continuous variables. A core challenge to combine the strengths of logic planners and continuous solvers is the design of an efficient interface that informs the logical search about continuous infeasibilities. In this paper we present a novel iterative algorithm that connects logic planning with nonlinear optimization through a bidirectional interface, achieved by the detection of minimal subsets of nonlinear constraints that are infeasible. The algorithm continuously builds a database of graphs that represent (in)feasible subsets of continuous variables and constraints, and encodes this knowledge in the logical description. As a foundation for this algorithm, we introduce Planning with Nonlinear Transition Constraints (PNTC), a novel planning formulation that clarifies the exact assumptions our algorithm requires and can be applied to model Task and Motion Planning (TAMP) efficiently. Our experimental results show that our framework significantly outperforms alternative optimization-based approaches for TAMP.
translated by 谷歌翻译
一些基于变压器的模型可以执行跨语言转移学习:这些模型可以通过一种语言对特定任务进行培训,并以另一种语言的同一任务给予相对良好的结果,尽管仅在单语任务中进行了预先培训。但是,关于这些基于变压器的模型是否学习跨语言的通用模式,目前尚无共识。我们提出了一种单词级的任务不可能的方法,以评估此类模型构建的上下文化表示的对齐方式。我们表明,与以前的方法相比,我们的方法提供了更准确的翻译成对,以评估单词级别对齐。我们的结果表明,基于多语言变压器模型的某些内部层优于其他明确对齐的表示,甚至根据多语言对齐的更严格的定义,更是如此。
translated by 谷歌翻译
背景:在信息提取和自然语言处理域中,可访问的数据集对于复制和比较结果至关重要。公开可用的实施和工具可以用作基准,并促进更复杂的应用程序的开发。但是,在临床文本处理的背景下,可访问数据集的数量很少 - 现有工具的数量也很少。主要原因之一是数据的敏感性。对于非英语语言,这个问题更为明显。方法:为了解决这种情况,我们介绍了一个工作台:德国临床文本处理模型的集合。这些模型接受了德国肾脏病报告的识别语料库的培训。结果:提出的模型为内域数据提供了有希望的结果。此外,我们表明我们的模型也可以成功应用于德语的其他生物医学文本。我们的工作台公开可用,因此可以开箱即用,或转移到相关问题上。
translated by 谷歌翻译
多样性规划算法在单个搜索空间中找到各种不同的起点和目标之间的路径。它们旨在通过在计划查询中重复使用信息来有效地做到这一点。可以在搜索之前或期间计算此信息,并且通常包括有效路径的知识。使用已知的有效途径来解决单个计划查询要比找到全新的解决方案所花费的时间更少。这允许多算法(例如PRM*)在许多问题上胜过诸如RRT*之类的单个算法,但它们的相对性能取决于重复使用的信息。尽管如此,很少有多Qualery计划者明确地寻求最大程度地提高路径重复使用,因此,许多计划者并没有始终如一地超越单寻球替代方案。本文介绍了努力的通知路线图(EIRM*),这是一种几乎渐近的最佳多样性计划算法,明确优先考虑重复使用计算工作。 Eirm*使用非对称双向搜索来识别可能有助于解决单个计划查询的现有路径,然后使用此信息来订购其搜索并减少计算工作。这使其可以在经过测试的抽象和机器人多样性计划问题上的最新计划算法找到最高级别的初始解决方案。
translated by 谷歌翻译
机器人通常需要解决路径规划问题,而环境的基本和离散方面则可以观察到。这引入了多模式,机器人必须能够观察并推断其环境状态。为了解决这个问题,我们介绍了计划在信仰空间中的路径树的路径优化(PTO)算法。路径树是一种类似树状的运动,具有分支点,机器人会收到可导致信仰状态更新的观察结果。机器人取决于收到的观察结果。该算法有三个主要步骤。首先,在状态空间上生长了快速探索的随机图(RRG)。其次,通过查询观察模型,将RRG扩展到信仰空间图。在第三步中,在信仰空间图上执行动态编程以提取路径树。最终的路径树结合了探索与剥削,即它平衡了获得有关环境的知识的需求,并需要达到目标。我们在导航和移动操作任务上演示了算法功能,并在最佳和运行时使用任务和运动计划方法(TAMP)表现出比基线的优势。
translated by 谷歌翻译
我们考虑针对翻译不变的动态系统的时间 - 最佳运动计划,该属性适用于许多移动机器人,例如差速器,汽车,飞机和多旋转器。我们的关键见解是,当与优化共生时,我们可以将图形搜索算法扩展到连续情况。对于图形搜索,我们引入了不连续性的A*(DB-A*),这是A*算法的概括,该算法使用了基于采样计划者的概念和数据结构。 db-a*重复使用短轨迹,所谓的运动原语作为边缘,并允许在顶点处最大的用户指定的不连续性。这些轨迹是通过轨迹优化在局部修复的,这也提供了新的改进的运动原语。我们的新型动力学运动计划者KMP-DB-A*几乎具有渐近的最佳行为,并迅速计算了近乎最佳的解决方案。对于我们的经验验证,我们提供了第一个基准,该基准测试在不同设置中的多个动态系统上比较搜索,采样和基于优化的时间 - 最佳运动计划。与基线相比,KMP-DB-A*始终求解更多的问题实例,找到较低成本的初始解决方案并更快地收敛。
translated by 谷歌翻译
任务和运动计划在解决严格的顺序操作问题方面取得了重大进展。但是,此类计划公式与反应性执行的控制方法之间存在差距。在本文中,我们提出了一种模型预测控制方法,该方法专门执行一个约束序列,该方法对应于TAMP计划的离散决策顺序。我们将总体控制问题分解为三个子问题(解决顺序航路点,其时序和一个简短的水平路径),每个问题是每个MPC循环中在线求解的一个非线性程序。最终的控制策略可以解释约束的长期相互依存关系,并通过所有约束来反应地计划正时正常的过渡。我们还建议在无法实现当前阶段的运行限制时进行回溯,从而导致一种流利的重新定位行为,这对实验者的扰动和干扰是可靠的。
translated by 谷歌翻译